وفقی سازی الگوریتم نزدیکترین همسایه برای دسته بندی داده های جریانی

پایان نامه
چکیده

امروزه در بسیاری از کاربرد ها، جریان داده به سرعت و در حجم زیاد تولید می شود. یکی از روش های با اهمیت در کاوش داده، دسته بندی آن است. از چالش های مهم دسته بندی جریان داده، تغییر مفهوم داده با گذشت زمان است که نیاز به، به روز رسانی مدل دسته بندی را مطرح می کند. تاکنون بسیاری از روش های سنتی دسته بندی داده برای تعامل با جریان داده بهبود داده شده اند. یکی از این الگوریتم های سنتی یادگیری، الگوریتم نزدیکترین همسایه است که یکی از الگوریتم های جذاب حوزه داده کاوی است. الگوریتم نزدیکترین همسایه با توجه به مکانیزم ساده تصمیم گیری در تحقیقات گذشته بسیار مورد توجه قرار گرفته است. این الگوریتم برای دسته بندی داده های جریانی با مشکلاتی مواجه خواهد شد که یکی از این مشکلات حجم نمونه ها است. ضمنا تعیین تعداد همسایه ها نیز برای تصمیم گیری این الگوریتم چالش برانگیز است. در این رساله دسته بندی جدیدی مبتنی بر الگوریتم نزدیکترین همسایه پیشنهاد شده است. مدل افزایشی این دسته بندی کننده، برای دسته بندی جریان داده بکار رفته است. سرعت مناسب یادگیری، انعطاف پذیری در زمان پاسخ و پایداری در برابر اغتشاش از مزایای این روش افزایشی هستند. دقت روش پیشنهادی با روش-های شناخته شده در این حوزه روی مجموعه داده های استاندارد واقعی و مصنوعی مقایسه شده است. نتایج بدست آمده حاکی از بهبود دقت، زمان و حافظه در روش افزایشی پیشنهادی است

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارزیابی عملکرد رهیافت توسعه یافته‌ی نزدیکترین همسایه در شبیه سازی داده های هواشناسی روزانه

مولدهای هواشناسی (Weather Generators) با هدف تطویل سری اطلاعات انواع متغیرهای وضع هوا اعم از بارش، دما و رطوبت نسبی، برای ارتقاءِ فهم و درک از عملکرد هر سیستمی که اقلیم عامل تاثیرگذار بر آن باشد، توسعه یافته‌اند. الگوریتم‌های متفاوتی از این مولدها در دو نوع کلی پارامتری و ناپارامتری تا به امروز ارائه شده‌اند. در این مطالعه کارایی مولد ناپارامتری k نزدیکترین همسایه با قابلیت برونیابی داده‌ها در س...

متن کامل

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

متن کامل

بهینه سازی گروه ذرات به روی پارامترهای کرنل و k نزدیکترین همسایه برای مسائل دسته بندی

در این پایان نامه یک روش حل مسائل دسته بندی ارائه می شود. کرنلها در روشهای حل مسائل دسته بندی کاربرد بسیاری دارند. با استفاده از کرنل، داده ها به فضایی با ابعاد بالاتر انتقال داده می شوند. به طور ایده آل انتظار می رود که در این فضا داده های مشابه در کنار یکدیگر قرار بگیرند. نو آوری این پایان نامه در به کار گرفتن روش دسته بندی k نزدیکترین همسایه در این فضا است. این عمل از نظر تئوری عملکرد مناس...

سیستم های دسته بندی فازی برای داده های جریانی

سیستم های خودگستر فازی روش هایی قدرتمند در جهت دسته بندی جریان های داده می باشند. در این سیستم ها، قوانین فازی به صورت خودکار تولید، به روز رسانی و حذف می گردند. با این حال، الگوریتم های معرفی شده تا این زمان نمی توانند به خوبی با مشکلات تغییر ناگهانی و تغییر تدریجی در مفهوم داده ها مقابله نماید. در این پایان نامه دو روش خودگستر آن لاین جهت دسته بندی جریان های داده معرفی شده اند، که بر خلاف روش...

15 صفحه اول

دسته بندی داده های جریانی فازی با استفاده از تحلیل پوششی داده ها

در این تحقیق یک روش دسته بندی داده های غیرقطعی از نوع فازی که از جمله چالش برانگیزترین حوزه های تحلیل داده محسوب می شود، ارائه شده است. در واقع حجم بالا و پیچیدگی روش های تحلیل داده مانع از توسعه روش هایی جهت تحلیل داده های فازی می شود. با این حال در برخی حوزه های دیگر همچون برنامه ریزی ریاضی پیشرفت های چشمگیری در مدل سازی سیستم هایی که داده های فازی از آنها در اختیار است، بدست آمده است و لذا ت...

متن کامل

ارزیابی عملکرد رهیافت توسعه یافته ی نزدیکترین همسایه در شبیه سازی داده های هواشناسی روزانه

مولدهای هواشناسی (weather generators) با هدف تطویل سری اطلاعات انواع متغیرهای وضع هوا اعم از بارش، دما و رطوبت نسبی، برای ارتقاءِ فهم و درک از عملکرد هر سیستمی که اقلیم عامل تاثیرگذار بر آن باشد، توسعه یافته اند. الگوریتم های متفاوتی از این مولدها در دو نوع کلی پارامتری و ناپارامتری تا به امروز ارائه شده اند. در این مطالعه کارایی مولد ناپارامتری k نزدیکترین همسایه با قابلیت برونیابی داده ها در س...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023